花费 6 ms
C#代码获取或设置Iframe中的HTML

在最近的数据采集研究中, 发现很多页面的内容都是在iframe中的, 这位采集带来了不少困难. 经过一番思考之后, 我想到了C#的解决办法: 1. 运行Spider Studio, 加载页面 htt ...

Fri Nov 29 07:24:00 CST 2013 5 8813
C# 脚本代码自动登录淘宝获取用户信息

最近遇到的一个需求是如何让程序自动登录淘宝, 获取用户名称等信息. 其实这个利用SS (SpiderStudio的简称) 实现起来非常简单. 十数行代码就可以做到非常完善: 1. 运行SS (下载地 ...

Fri Jan 03 08:00:00 CST 2014 12 5933
分享一个天气历史数据的采集脚本

最近一个项目中需要用到过往的天气数据, 我找到了天气后报这个网站 (www.tianqihoubao.com), 并在SS中完成了相关采集, 和大家分享一下. 首先分析这个网站提供了两种信息: 1 ...

Wed Jan 22 19:28:00 CST 2014 4 4556
C#中另辟蹊径解决JSON / XML互转的问题

最近在一个POC的项目中要用到JSON和XML的相互转换, 虽然我知道很多类库如JSON.NET具备这种功能, 但是我还是另辟蹊径的使用Spider Studio结合一个在线工具网站快速实现了这个功能 ...

Thu Dec 26 07:30:00 CST 2013 7 2653
分享: 利用Readability解决网页正文提取问题

做数据抓取和分析的各位亲们, 有没有遇到下面的难题呢? - 如何从各式各样的网页中提取正文!? 虽然可以用SS为各种网站写脚本做解析, 但是互联网各类网站何止千万种, 纵使累死我们也是做不完的. ...

Thu Jan 23 07:06:00 CST 2014 3 3094
示例 - 17行代码实现一个简单高效的多线程蜘蛛程序

多线程蜘蛛程序是一个很有用的组件, 我在自己开发的Spider Studio中也提供了一个. 在设计上我尽量遵循使用简单的原则, 大量使用dynamic对象的特性, 使得代码非常精简灵活, 通过17行 ...

Mon Mar 03 20:51:00 CST 2014 4 1998

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM